Aprendizaje Off-Policy con Zero-Shot Aprende cómo el método Zero-Shot Off-Policy Learning permite adaptar políticas a nuevas tareas sin reentrenamiento, usando medidas sucesoras y corrección de distribución para una rápida adaptación. 2026-06-02 · 1 min